Skip to main content

Einführung in die Distributionelle Semantik

Die Bedeutung sprachlicher Zeichen: Bedeutungstheorien

Die Bedeutung sprachlicher Zeichen liegt...

  • ...in ihrer Beziehung zu Dingen in der Welt.

    ➔ realistische Antwort (Wittgenstein, Carnap, Montague)

  • ...in ihrer Zuordnung zu mentalen Repräsentationen (Konzepten).

    ➔ kognitivistische Antwort (Lakoff, Jackendoff, Fodor)

  • ...in ihrem Gebrauch.

    ➔ gebrauchstheoretische Antwort (Wittgenstein, Austin, Grice)

Vgl. ausführlich zur distributionellen Semantik und Bedeutungstheorien generell: Studienbuch Linguistik: 101ff., Kapitel 3

Ludwig Wittgenstein

Man kann für eine grosse Klasse von Fällen der Benützung des Wortes ‘Bedeutung’ – wenn auch nicht für alle Fälle seiner Benützung – dieses Wort so erklären: Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache.

(Wittgenstein, Ludwig: Philosophische Untersuchungen, 1952)

John Rupert Firth

You shall know a word by the company it keeps.

(Firth, J. R. 1957:11)

Semantische Räume

Ausgangspunkt: Kollokationsprofil

  • Maske: tragen, nützen, ohne, schützen, Abstand, Tragen, kein, FFP2, anziehen, ÖV, mit, Pflicht, nichts, Desinfektionsmittel, Handschuh, Maske, FFP3, FFP, eine, bringen, kaufen, Schutz, ziehen, einkaufen, aufsetzen, getragen, genügend, Kinn, Nase, Hygiene, Träger, chirurgisch, rumlaufen…
  • Hygienemaske: eine, tragen, Raum, geschlossen, schützen, mit, wer, Träger, nur, normal, Schutz, kaufen, “, in, vor, bei, also, du, einfach, werden, Maske, oder, sie wenn, die, dass, sollen, (, müssen, immer, auch…

Matrix

tragenschützenKrankheitTürGleis
Virus4153000
Hygienemaske18212010
Maske20201510
Haus153221
Bahnhof200225

Vektoren

Vektoren

  • Darstellung der Kollokationsprofile im Vektorraum
  • im Beispiel: nur zwei Dimensionen; richtiges Modell: 33.000 Dimensionen (Dimensionsreduktion auf 100)
  • Distanz zwischen den Punkten: Ausdruck von semantischer Nähe
  • neuronales Lernen (Deep Learning) der Ähnlichkeit der Vektoren – verschiedene Verfahren, z.B. word2vec (Mikolov et al. 2013)

Vorberechnete Modelle

Literatur

Anwendungen

Bubenhofer, Noah (2022): Exploration semantischer Räume im Corona-Diskurs. In: Sprache in Politik und Gesellschaft: Perspektiven und Zugänge. Mannheim (Jahrbuch des Instituts für Deutsche Sprache).

Bubenhofer, Noah (2021): Masken und Küsschen: Korpuslinguistische Exploration des Corona-Diskurses in der Deutschschweiz. In: Mitteilungen des Deutschen Germanistenverbandes. 68 (2), S. 127–140.

Bubenhofer, Noah (2020): Semantische Äquivalenz in Geburtserzählungen: Anwendung von Word Embeddings. In: Zeitschrift für germanistische Linguistik. 48 (3), S. 562–589, doi: 10.1515/zgl-2020-2014.

Bubenhofer, Noah; Calleri, Selena; Dreesen, Philipp (2019): Politisierung in rechtspopulistischen Medien: Wortschatzanalyse und Word Embeddings. In: OBST. Osnabrücker Beiträge zur Sprachtheorie. (95), S. 211–242.

Literatur zu Word Embeddings

Lenci, Alessandro (2018): Distributional Models of Word Meaning. In: Annual Review of Linguistics 4 (1), S. 151–171. doi:10.1146/annurev-linguistics-030514-125254.

Kozlowski, Austin C./Taddy, Matt/Evans, James A. (2018): The Geometry of Culture: Analyzing Meaning through Word Embeddings. In: CoRR abs/1803.09288,.

Mikolov, Tomas/Chen, Kai/Corrado, Greg/Dean, Jeffrey (2013): Efficient Estimation of Word Representations in Vector Space. In: arXiv:1301.3781 [cs],.

Mikolov, Tomas/Sutskever, Ilya/Chen, Kai/Corrado, Greg/Dean, Jeffrey (2013): Distributed Representations of Words and Phrases and their Compositionality. In: arXiv:1310.4546 [cs, stat],.